AI资讯新闻榜单内容搜索-Coding Age

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: Coding Age

所有人都在卷 Coding Agent，商汤说下一个能「交付」的行业是设计

所有人都在卷 Coding Agent，商汤说下一个能「交付」的行业是设计

所有人都在卷 Coding Agent，商汤说下一个能「交付」的行业是设计

过去一年，AI 行业最确定的故事属于 Coding。

来自主题: AI资讯

9207 点击 2026-07-20 10:45

Claude、GLM、GPT谁才是真正的AI软件工程师？首个持续更新Visual Spec-to-App Benchmark发布

Claude、GLM、GPT谁才是真正的AI软件工程师？首个持续更新Visual Spec-to-App Benchmark发布

Claude、GLM、GPT谁才是真正的AI软件工程师？首个持续更新Visual Spec-to-App Benchmark发布

为了解决这一问题，来自 University of Arizona、Zoom 与 Stony Brook University 的研究团队推出了 VISTA（VIsual Spec-To-App Benchmark）, 首个面向 Visual Spec-to-Web-App Coding Agents 的端到端 Benchmark。

来自主题: AI技术研报

8238 点击 2026-07-06 15:49

往 Codex 里塞块无限画布，AI 改图终于能指哪打哪了｜附教程

往 Codex 里塞块无限画布，AI 改图终于能指哪打哪了｜附教程

往 Codex 里塞块无限画布，AI 改图终于能指哪打哪了｜附教程

和 Codex、Claude Code 等 Coding Agent 沟通，很多时候就像站在许愿池边，对着池子里的王八扔硬币，嘴里念念有词，关键它还真给你兑现愿望。

来自主题: AI技术研报

7344 点击 2026-06-25 15:26

你以为是 AI 在干活，其实那个循环一直是你——一个 OpenAI 员工聊 loop engineering

你以为是 AI 在干活，其实那个循环一直是你——一个 OpenAI 员工聊 loop engineering

你以为是 AI 在干活，其实那个循环一直是你——一个 OpenAI 员工聊 loop engineering

OpenAI 的 tevfik 写了篇关于 loop engineering 的文章,开头那句我读完顿了一下。他说,他和 coding agent 协作,到现在大多还是同一个流程:我解释一个任务,等结果,审一遍,再发下一条指令。代码是 agent 写的,但我在后台还干着另一份活——我记着发生了什么、决定下一步做什么、判断这事到底完成没。

来自主题: AI技术研报

7877 点击 2026-06-21 10:59

Claude Code爆火背后的Agent Harness底层逻辑，UIUC、Meta、斯坦福深度解读

Claude Code爆火背后的Agent Harness底层逻辑，UIUC、Meta、斯坦福深度解读

Claude Code爆火背后的Agent Harness底层逻辑，UIUC、Meta、斯坦福深度解读

过去两年，大模型写代码已经不再新鲜。从代码补全到 GitHub issue 修复，从竞赛编程到仓库级软件工程，人们习惯用一个简单标准评估 coding agent：代码能不能写对？测试能不能通过？

来自主题: AI技术研报

9887 点击 2026-06-10 10:02

Anthropic最新博客：生物学Agent的瓶颈不在模型，而在数据基础设施

Anthropic最新博客：生物学Agent的瓶颈不在模型，而在数据基础设施

Anthropic最新博客：生物学Agent的瓶颈不在模型，而在数据基础设施

当前，Coding Agents 在软件工程领域一路高歌猛进，科学家们看到此场景，也不禁寄予厚望：AI 智能体何时能以同样的速度，帮人类攻克药物设计、病毒监控与生物学建模的重重难关？

来自主题: AI技术研报

11503 点击 2026-06-09 14:53

Coding Agent 技术全景图：Context Engineering、Subagents 与 Harness，一年范式转移全解析

Coding Agent 技术全景图：Context Engineering、Subagents 与 Harness，一年范式转移全解析

Coding Agent 技术全景图：Context Engineering、Subagents 与 Harness，一年范式转移全解析

一年前，行业还在为“从自动补全到 Agent”的进化感到兴奋。然而一年过去，我们不难发现单纯靠“Vibe Coding”和“Prompt 调优”，面对非确定性模型带来的风险和成本问题，显然无法撑起企业级软件开发。

来自主题: AI技术研报

7425 点击 2026-06-09 09:37

花了1000倍的token，效果可能却没有更好：AI Agent的“隐性账单”长什么样

花了1000倍的token，效果可能却没有更好：AI Agent的“隐性账单”长什么样

花了1000倍的token，效果可能却没有更好：AI Agent的“隐性账单”长什么样

如今的 AI Agent 正在大规模落地，其中应用最广且最受关注的当数 Claude Code，Codex，Cursor 这类 coding agent。过去的一年里，这类 coding agent 产品迭代迅速，在一年内将在 swe-bench- verified 的准确率提高到了 78%+。

来自主题: AI技术研报

7542 点击 2026-05-19 10:00

马斯克花 100 亿想清楚一件事，不做 coding agent 就是等死

马斯克花 100 亿想清楚一件事，不做 coding agent 就是等死

马斯克花 100 亿想清楚一件事，不做 coding agent 就是等死

OpenAI 的两大宿敌 Anthropic 和马斯克，放下心中成见之后终于在月初结盟了。

来自主题: AI资讯

8934 点击 2026-05-18 16:51

24小时从零写一个GBA模拟器！GPT-5.5跑出53分登顶，Gemini得了0.8分，底部还有两家交白卷

24小时从零写一个GBA模拟器！GPT-5.5跑出53分登顶，Gemini得了0.8分，底部还有两家交白卷

24小时从零写一个GBA模拟器！GPT-5.5跑出53分登顶，Gemini得了0.8分，底部还有两家交白卷

Mechanize 发布了一项硬核测试：给前沿 AI coding agents 24 小时，用 Rust 从零写一个完整的 Game Boy Advance 模拟器，再和顶级开源模拟器 Mesen2 逐帧对比打分。

来自主题: AI技术研报

10249 点击 2026-05-18 16:48

上一页当前第1页,共4页下一页